Modelos toman notas en prefill: caché KV editable y componible Descubre cómo editar y componer la caché KV durante el prefill reduce la latencia hasta 14.9x sin perder precisión. Ideal para modelos de IA en producción. 2026-06-17 · 3 min